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Resumen 


En el centro y sur de la república mexicana cada año los huracanes del 
mar Caribe y del océano Pacífico originan crecientes que definen una 
estación húmeda, y que en general aumentan en magnitud y peligrosidad 


conforme transcurre la temporada de ciclones. Ambas condiciones 
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permiten el análisis de frecuencias bivariado de sus fechas de ocurrencia 
y sus gastos máximos (Qm). En este estudio, la distribución conjunta se 
formó con base en la función Cópula de Gumbel-Hougaard, que satisface 
la condición de dependencia (Af"“) observada y que combina como 
distribuciones marginales la de von Mises para las fechas de ocurrencia 
en el año y para los Qm una función probabilística idónea. La teoría 
expuesta se aplica a las crecientes anuales registradas en la estación de 
aforos Guamúchil de la Región Hidrológica No. 10 (Sinaloa), México, en el 
periodo de 1940 a 1971. La distribución de von Mises se ajusta vía 
optimización numérica con el algoritmo de Rosenbrock y la distribución 
idónea de los Qm fue la Kappa. Se formó la gráfica de periodos de retorno 
conjuntos de tipo AND de 50, 100 y 500 años. Además, se estimaron 
periodos de retorno conjuntos condicionales de fechas de ocurrencia, 
dado que el Om tiene los periodos de retorno citados. Lo anterior permite 
estimaciones de la probabilidad de excedencia del Qm en lapsos definidos. 
Las conclusiones destacan la simplicidad de estos análisis de frecuencias 
bivariados por medio de las funciones Cópula y la importancia práctica de 


sus predicciones, según las fechas de ocurrencia. 


Palabras clave: fechas de ocurrencia, distribución de von Mises, 
funciones Cópula, cociente tau de Kendall, probabilidades empíricas 
conjuntas, dependencia en el extremo derecho, periodos de retorno 


conjuntos y condicionales. 
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Abstract 


In the center and south of the Mexican Republic, each year the hurricanes 
of the Caribbean Sea and the Pacific Ocean cause floods that lead to a 
wet season and that generally increase in magnitude and danger as the 
cyclone season progresses. Both conditions allow bivariate frequency 
analysis of their dates of occurrence and their maximum flows (Qm). In 
this study, the bivariate distribution was formed based on the Gumbel- 
Hougaard Copula function, which satisfies the observed dependency 
condition (A$“) and which combines the von Mises distributions as 
marginal distributions for the dates of occurrence in the year and for the 
Qm a suitable probabilistic function. The exposed theory is applied to the 
annual floods recorded at the Guamúchil gauging station of Hydrological 
Region No. 10 (Sinaloa), Mexico, in the period from 1940 to 1971. The 
von Mises distribution is fitted via numerical optimization with the de 
Rosenbrock algorithm and the ideal distribution of the Qm turned out to 
be the Kappa. The graph of joint return periods of the AND type of 50, 
100 and 500 years was formed. In addition, conditional joint return 
periods of occurrence dates were estimated given that the Qm has the 
cited return periods. This allows estimates of the probability of 
exceedance of Qm in defined periods. The conclusions highlight the 
simplicity of these bivariate frequency analyses, by means of the Copula 
functions, and the practical importance of their predictions, according to 


the dates of occurrence. 


Keywords: Dates of occurrence, von Mises distribution, Copula functions, 
Kendall's tau ratio, joint empirical probabilities, dependency on the 


extreme right, joint and conditional return periods. 
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Introducción 


Generalidades 


En términos generales, el riesgo de las inundaciones y sus daños son 
función directa del volumen de agua que escurre por el cauce, y que 
excede su límite o capacidad, desbordándose y cubriendo las planicies de 
inundación. Sin embargo, la fecha de ocurrencia del evento es tan 
importante como su magnitud y en algunos casos mayor cuando se 
presentan fuera de la temporada o estación húmeda debido a que toma 
a la población desprevenida y causa daños mayores (Khedun, Singh, 8 
Byrd, 2019). 


Por lo anterior, la estimación de la probabilidad de ocurrencia de las 
crecientes a lo largo del año es vital para la elaboración de los planes sin 
obras hidráulicas de mitigación de daños, que incluyen la preparación para 
el evento, con el propósito de reducir la exposición y vulnerabilidad de la 
población, así como optimizar los recursos económicos disponibles para 
la emergencia y acelerar la recuperación posterior al evento (Durrans, 
Eiffe, Thomas, 8 Goranflo, 2003; Khedun et a/., 2019). 
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En general, entender el comportamiento estacional de las crecientes 
es vital en la planeación y el manejo de los recursos hidráulicos del río 
tanto para los usos agrícolas e hidroeléctricos como para la navegación, 
usos recreativos y otras actividades asociadas con los cuerpos de agua. 
Por lo anterior, conocer la relación que guardan el gasto máximo con su 
fecha de ocurrencia es sumamente importante, al grado de requerir su 


estudio conjunto bivariado (Chen, Guo, Yan, Liu, 8 Fang, 2010). 


El análisis de frecuencia de crecientes bivariado comenzó 
formalmente a principios del siglo XXI (Yue € Rasmussen, 2002), y por lo 
general se basó en el gasto máximo y el volumen de las crecientes 
anuales, utilizando la distribución Normal bivariada y el llamado modelo 
Logístico, que acepta como funciones de distribución de probabilidades 
(FDP) marginales iguales a las distribuciones de valores extremos; las 
más comunes, Gumbel y GVE (Escalante-Sandoval 8 Reyes-Chávez, 


2002; Aldama, Ramírez, Aparicio, Mejía-Zermeño, 8: Ortega-Gil, 2006). 


El análisis bivariado de las crecientes es el enfoque multivariado 
más simple y aun así implica cinco complicaciones matemáticas: (1) se 
debe emplear una FDP bivariada; (2) su validación requiere la estimación 
de las probabilidades empíricas bivariadas; (3) ahora existen 
probabilidades conjuntas y condicionales; (4) se debe definir un periodo 
de retorno conjunto, para el cual existen infinitas parejas de valores de X 
y Y que lo satisfacen, y (5) hay que seleccionar entre las parejas citadas 
los eventos críticos o de diseño (Ramírez-Orozco 8 Aldama, 2000; 
Escalante-Sandoval 8. Reyes-Chávez, 2002; Volpi € Fiori, 2012; Requena, 
Mediero, 8 Garrote, 2013). 
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Actualmente, mediante el uso de la herramienta matemática 
conocida como “Cópulas”, se pueden construir FDP bivariadas con 
marginales de tipos diferentes debido a que las funciones cópula permiten 
representar distribuciones multivariadas a partir de las FDP univariadas o 
marginales, sin importar su forma o tipo (Salvadori, De Michele, 
Kottegoda, € Rosso, 2007; Meylan, Favre, € Musy, 2012; Genest 8 
Chebana, 2017; Zhang € Singh, 2019; Chowdhary €: Singh, 2019). 


Por medio de las funciones Cópula se aborda el análisis de 
frecuencias bivariado de las fechas de ocurrencia de las crecientes anuales 
y sus gastos máximos. Las primeras son representadas por la distribución 


de von Mises y los segundos por una FDP idónea. 


Objetivos 


Los objetivos de este estudio se pueden englobar en los seis siguientes: 
(1) se exponen los estadísticos direccionales que representan a las fechas 
de ocurrencia de las crecientes en el año; (2) se describe la distribución 
de von Mises (dvM) y su ajuste vía optimización numérica, que permite la 
caracterización probabilística de las fechas de ocurrencia; (3) se 
presentan las características básicas de las funciones Cópula (FC) de 
Frank y de Gumbel-Hougaard, que incluyen cociente tau de Kendall, 
dependencia observada y de la FC, estimación de las probabilidades 
empíricas conjuntas y selección y ratificación de la FC; (4) se expone la 
selección y adopción de la FDP marginal idónea de los gastos máximos 
anuales; (5) se describen los periodos de retorno conjuntos de tipo OR, 


AND y condicionales, y (6) se detalla como ejemplo numérico la aplicación 
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de la teoría y procedimientos expuestos a las 32 crecientes anuales 
registradas en la estación hidrométrica Guamúchil de la Región 


Hidrológica No. 10 (Sinaloa), México. 


Teoría operativa 


Datos circulares e indicadores direccionales 


Las fechas de ocurrencia de las crecientes anuales en México por lo 
general definen una estación húmeda, que abarca de junio a octubre, 
temporada de incidencia de los huracanes que se generan en el mar 
Caribe y en el océano Pacífico. Por lo anterior, las fechas de ocurrencia de 
las crecientes anuales se pueden representar dentro de un círculo, que 


abarca los 365 días del año. 


Existen varias convenciones o formas de trabajar en el círculo para 
dibujar los datos (Ramírez-Orozco, Gutiérrez-López, 8 Ruiz-Silva, 2009). 
En adelante, se usará la convención de Burn (1997), por su semejanza 
con los cuadrantes cartesianos. En tal esquema, el avance es contrario a 
las manecillas del reloj, iniciando en el eje de las abscisas; por ello, los 


días 1 de enero y 31 de diciembre coinciden en tal inicio. 


Teniendo varios datos circulares dibujados es posible obtener sus 
indicadores direccionales, los más importantes son dos: su dirección 
media (a) y su índice estacionalidad (r). El primero define la tendencia 
central de los datos y, por lo tanto, es la fecha de ocurrencia promedio de 
las crecientes anuales; el segundo cuantifica la dispersión de tales valores 
(Campos-Aranda, 2017). 
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Dirección media e índice de estacionalidad 


Para estimar estos indicadores se comienza por transformar cada fecha 
de ocurrencia de las crecientes anuales a día juliano (D;), es decir, de O a 
365; lo anterior implica no considerar los años bisiestos. Si una creciente 
ocurre el 29 de febrero, se le asigna el día 28. Las fechas de enero quedan 
igual, pero a las de febrero se les suma 31, a las de marzo 59, a las de 
abril 90 y así sucesivamente hasta las de noviembre a las que se les 
agrega 304, y a las de diciembre se les suma 334 para obtener el día 
juliano. Enseguida se obtiene el ángulo a; en radianes, correspondiente a 
la fecha ¡ de cada creciente (D;), con la expresión siguiente (Burn, 1997; 
Cunderlik, Ouarda, 8 Bobée, 2004; Chen, Singh, Guo, Fang, € Liu, 2013; 
Campos-Aranda, 2023b): 


a; =2m=X,con0<a,< 21 (1) 


en la cual: 
Tr = número pi con 3.141592654 como valor aproximado 
X¡ = variable aleatoria de las fechas de ocurrencia en radianes 


Enseguida, las coordenadas x y y de las fechas de ocurrencia de las 
crecientes descritas por los ángulos «a, se estiman con base en los cosenos 


y senos, y se obtienen sus valores medios a través de las ecuaciones 


siguientes: 
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x = “Y, cos (a) (2) 
y = ¿Xiz, sen (ay) (3) 
siendo: 


n = número de fechas de ocurrencia de las crecientes anuales analizadas 


Ahora, la dirección media (a) de la fecha promedio de las crecientes 


será: 


A = arctan (2) (4) 


x 


La aplicación de la ecuación anterior se realiza obteniendo primero 
el arco tangente de y entre x, ambas con signo positivo designado a, en 
radianes; entonces, si x y y son positivas q = a; six<0yy>0a=x—-— 
a; si ambas son negativas a = 1 +a; por último, six>0yy<0a=2r-— 
a. Los ángulos a, y a se transforman a grados (de O a 3600) al 
multiplicarlos por 57.295755. 


El valor de a en día juliano se denomina día medio de las crecientes 
(DMC), y se obtiene dividiendo entre 2 y multiplicando por 365. El índice 
DMC indica la fecha promedio de ocurrencia de los gastos máximos 
anuales en una cuenca dada. Se puede esperar que cuencas con valores 


similares del DMC presenten semejanzas en otras características 
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hidrológicas importantes. Lógicamente, el DMC estará relacionado con el 
tamaño de la cuenca y con su localización geográfica dentro de la región 
hidrológica estudiada (Burn, 1997; Cunderlik et a/., 2004). 


Una medida de la variabilidad de las n fechas de ocurrencia de las 
crecientes, en relación con el DMC, se puede estimar calculando la 


resultante media, cuya expresión es: 
T=,yx?+ y? (5) 


El índice de estacionalidad r es una medida adimensional de la 
dispersión de los datos, y toma valores entre O y 1. Un valor unitario 
indica que todas las crecientes ocurren en la misma fecha; en cambio, un 
valor cercano a cero implica gran variabilidad de ocurrencias a lo largo de 


todo el año. 


Ramírez-Orozco et al. (2009) establecen los siguientes cinco grados 
de estacionalidad: (1) muy fuerte, cuando r > 0.90; (2) fuerte, cuando F 
fluctúa entre 0.70 y 0.90; (3) media, cuando f varía de 0.50 a 0.70; (4) 
baja, cuando f cambia de 0.10 a 0.50, y (5) muy baja o débil, cuando r 
< 0.10. Chen et a/. (2013) indican que si y es cercano a la unidad, se 
puede esperar que una sola temporada o estación húmeda sea 


dominante. 
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La distribución de von Mises 


Este modelo probabilístico es de uso común para representar variables 
aleatorias que tienen dirección en dos dimensiones y una moda única. Por 
ello, la distribución de von Mises (dvM) se considera la analogía natural 
del modelo Normal para datos estacionales. Su función de densidad de 
probabilidad es la ecuación siguiente (Metcalfe, 1997; Carta, Bueno, 8 
Ramírez, 2008; Chen et a/., 2010): 


f0) = 2ESCA ono0<x<2m,0<u<2m,x>0 (6) 
2119 (K) 


La dvM es simétrica con su moda en x = yu, que también es su 
dirección media (a), y la dispersión está dada por el parámetro de 
concentración k (kappa). El denominador de la Ecuación (6) hace que el 
área bajo la curva sea unitaria y por ello se le llama factor de 
normalización (FN); incluye la función modificada de Bessel de primer tipo 


de orden cero [lo(k)|]. 


Para estimar la probabilidad de no excedencia de un valor x se 


integra numéricamente la Ecuación (6), esto es: 


1 
2rcl0 (10) 


F(x) = 


E explx - cos(x — 1)] (7) 


La expresión anterior define la FDP de la dvM. Jo(k) se estima con 


la siguiente serie ascendente, que proviene de Olver (1972): 
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(2/4) , (2/02 , (62/08, (1?/9* , («?2/4)” 
lo() =1+ 1 le 4 + 36 + 576 lerrr ds (8) 


Integración numérica de la dvM 


Para llevar a cabo tal integración numérica de la Ecuación (7) se adoptó 
el método de la cuadratura Gauss-Legendre, cuya ecuación operativa 
univariada es (Nieves 8 Domínguez, 1998; Campos-Aranda, 2003): 


FO) dx <a wof [Ccorio+a] a 


en la cual: 
w;¡= coeficientes del método, cuyas abscisas son h; 


np = número de parejas en donde se evalúa la función f(x), con el 


argumento indicado en f(:) de la Ecuación (9) 


En Davis y Polonsky (1972) se obtuvieron las 12 parejas utilizadas 


de w; y h; con 15 dígitos debido a que el lenguaje Basic acepta 16 dígitos 


como variables de doble precisión. 
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Ajuste de la dvM en la estación húmeda 


Cuando las fechas de ocurrencia de las crecientes anuales abarcan en su 
mayoría un lapso en meses bastante definido, por ejemplo, de junio a 
octubre, entonces la aplicación de la Ecuación (7) se realiza vía 
optimización numérica, para buscar los valores de y y k que reduzcan la 
suma de las diferencias entre probabilidades teóricas [Fr(x)] y empíricas 


[FEOO] al cuadrado, esto es: 
Minimizar FO = Y ¿[Fr(x) — Fe (01? (10) 


La minimización de la función objetivo anterior se realizará por 
medio del algoritmo de Rosenbrock. Las probabilidades empíricas se 
definen con la fórmula de Gringorten (Chen et a/., 2010), que es la 


siguiente: 


Fa) == (11) 


n+0.12 


en la cual: 


m = número de orden del dato o fecha de ocurrencia en radianes (x = a;) 


cuando se ubican en magnitud progresiva 
n = número total de datos 


Lógicamente, se eliminan de modo previo las fechas ocurrencia 


acontecidas fuera del lapso principal o estación húmeda de las crecientes 
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para mejorar el ajuste y, por lo tanto, la definición de la dvM. Mayores 
detalles del proceso anterior se pueden consultar en Campos-Aranda 
(2023b). 


Algoritmo de Rosenbrock 


Es un procedimiento numérico de búsqueda directa que intenta definir el 
mínimo de una función no lineal de múltiples variables aleatorias no 
acotadas. El algoritmo de Rosenbrock asume que la función es unimodal, 
y comienza definiendo una línea recta o dirección de búsqueda a partir de 
un punto dado inicial. Enseguida evalúa la función objetivo (FO) en varios 
puntos de la línea y determina el óptimo; cuando sucede esto, se 
selecciona una nueva dirección de búsqueda y el proceso se repite de 


manera recursiva por etapas. 


En este algoritmo es conveniente dar diferentes puntos iniciales 
para buscar el mínimo global a partir de los mínimos locales estimados. 
Una descripción más detallada del proceso se tiene en Rosenbrock (1960), 
Kuester y Mize (1973), y Campos-Aranda (2003). 


Ventajas de las funciones Cópula 


Como ya se indicó, la ventaja esencial de las funciones Cópula (FC) 
consiste en permitir expresar una distribución conjunta de variables 
aleatorias correlacionadas, como una función de sus distribuciones 
marginales, previamente adoptadas. Entonces, una FC enlaza o relaciona 


las distribuciones marginales univariadas para formar una distribución 
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multivariada. Otra ventaja básica de las FC al formar distribuciones 
multivariadas es el hecho de que ellas separan el efecto de la dependencia 
entre las variables aleatorias de los efectos de las distribuciones 


marginales en la modelación conjunta. 


Debido a lo anterior, la construcción de la distribución multivariada 
se reduce al estudio de la relación que guardan las variables 
correlacionadas si las distribuciones marginales univariadas son 
conocidas. El uso de las FC ofrece entera libertad para adoptar o 
seleccionar las distribuciones marginales univariadas que mejor 
representen a los datos (Meylan et al., 2012; Zhang 8 Singh, 2019; 
Chowdhary 8 Singh, 2019). 


Familias de Cópulas por aplicar 


Las funciones Cópula (FC) que han sido desarrolladas se han clasificado 
en cuatro clases: de Arquímedes, de valores extremos, elípticas y 
misceláneas. También se clasifican en Cópulas de un parámetro o de 
varios, dependiendo de la amplitud con la cual se defina la estructura de 
la dependencia entre las variables X y Y (Meylan et a/., 2012; Chowdhary 
8, Singh, 2019). Salvadori et al. (2007) exponen un resumen amplio y útil 


de FC que han sido aplicadas en el campo de la hidrología. 


Designando a Fx(x) = u, Fy(y) = v y 0 el parámetro que mide la 
dependencia o asociación entre u y v, se tienen las siguientes dos familias 
de Cópulas de Arquímedes y de valores extremos (Salvadori et a/., 2007; 
Zhang € Singh, 2019; Chen € Guo, 2019; Chowdhary € Singh, 2019). 


1. Frank. Su ecuación y espacio de variación de O son: 
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e79U-1)(e797-1) 


CCuw) == In 1 +1 a | E 0) (12) 


Para la dependencia negativa 0 <6< 1 y para la positiva 6 > 1, con 
9 = 1 para la independencia entre u y v. La relación de 6 con el 7, es la 


siguiente: 
1 =1+3[D1(0) 1] (13) 


siendo Di(0) la función Debye de orden 1, cuya expresión es: 


DO = 5, ds (14) 


5-1 


La ecuación anterior se estimó con integración numérica, ratificando 


sus resultados con los valores tabulados por Stegun (1972). 


2. Gumbel-Hougaard, la cual acepta solo dependencia positiva. 


Su ecuación y espacio de variación de 0 son: 
C(u,v) = exp [E In uy? + (In NÓ [1, 00) (15) 


Con 6 = 1 se tiene independencia entre u y v. La relación de 6 con 


el cociente tau de Kendall es la siguiente: 
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.m=>+ (16) 


Medidas de asociación 
Concordancia 


Como la FC caracteriza la dependencia entre las variables aleatorias u y 
v, es necesario el estudio de las medidas de asociación para disponer de 
un método que permita estimar su parámetro 6. En términos generales, 
una variable aleatoria es concordante con otra cuando sus grandes 
valores están asociados con los grandes valores de la otra y los valores 
pequeños de una con los valores reducidos de la otra (Salvadori et al., 
2007; Chowdhary 8 Singh, 2019). 


Unas variables con correlación lineal directa serán concordantes, 
pues al aumentar una la otra también lo hace. Variables con correlación 
lineal inversa serán discordantes, ya que a grandes valores de una le 
corresponderán pequeños valores de la otra. Lo anterior implica que son 
concordantes (c) las parejas (x1 — x2)(y1 — y2) > O y discordantes (d) 
cuando (x1 — x2)(y1 — y2) < O (Salvadori et a/., 2007; Chowdhary 8, Singh, 
2019). 


Una medida numérica de asociación es un estadístico que indica el 
grado de dependencia o asociación de las variables. Para fines de 
comparación, tales medidas varían de O a +1 o a -—1, indicado la 


asociación perfecta positiva en +1 o negativa en —1. El cociente tau de 
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Kendall y el coeficiente rho de Spearman son dos medidas no 
paramétricas que proporcionan información sobre una forma especial de 
asociación o dependencia conocida como concordancia (Salvadori et al., 
2007; Chen 8: Guo, 2019). 


Cociente tau de Kendall 


Mide la probabilidad de tener parejas concordantes, por lo cual es el 
cociente de c — d entre c + d. Su expresión para estimarlo con datos 
bivariados es (Zhang € Singh, 2006; Zhang € Singh, 2019): 


= 4 A signo| (x; — x;)(y; — y;)] (17) 


n—n(n-1) 


en la ecuación anterior: 
n = número de observaciones 
signo[:] = +1 si tales parejas son concordantes y —1 si son discordantes 


Genest y Favre (2007) exponen una prueba para el cociente tau, 
adoptando como hipótesis nula Ho en el que X y Y son independientes y 
entonces el estadístico tiene distribución aproximadamente Normal con 
media O y varianza 2(2n + 5) / [9n(n — 1)]. Entonces Ho será rechazada 


con un nivel de confianza a = 5 % si: 


9n(n-1) 


Iza l > Zar, = 1.96 (18) 
/ 


2(2n+5) 
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Estimación del parámetro de dependencia 


El método más simple para estimar el parámetro 6 de las FC se asemeja 
al método de momentos y se basa en la inversión de la ecuación que 
relaciona a 6 con el cociente tau de Kendall o con el coeficiente rho de 
Spearman (Meylan et a/., 2012; Chowdhary € Singh, 2019; Zhang 8 
Singh, 2019; Chen 8: Guo, 2019). Para obtener 6, en la Ecuación (13) se 


procede por tanteos; en cambio, en la Ecuación (16) se despeja su valor. 


Estimación de probabilidades empíricas conjuntas 


Las probabilidades empíricas bivariadas se estimaron con base en la 
fórmula de Gringorten, aplicada por Yue (2000b), Zhang y Singh (2019), 
y Chen y Guo (2019). Tal fórmula es: 


— i-0.44 (19) 


— n+0.12 


en la cual: 
¡ = número de cada dato cuando están ordenados de manera progresiva 
n = número total de ellos o amplitud del registro procesado 


La expresión anterior se aplicó en el plano bidimensional, con los 
datos ordenados en forma progresiva; las fechas de ocurrencia (X;) en los 


renglones y los gastos máximos (Q;) en las columnas. El plano formado 


98 


Tecnología y ciencias del agua, ISSN 2007-2422, 


Open Access bajo la licencia CC BY-NC-SA 4.0 a A e a AL 
(https://creativecommons.org/licenses/by-nc-sa/4.0/) 15(4), 80-136. DOI: 10.24850/j-tyca-2024-04-03 


a 0) Check for updates 
OPEN ACCESS 


Tecnología y 

CienciaszAgua 
es un cuadrado de n por n casillas, con n casillas en su diagonal principal 
cuando el número de orden del renglón es igual al de la columna. 
Después, cada pareja de datos anual (X; y Q;) se localiza en el plano 
bidimensional, y la casilla definida por la intersección del renglón y 
columna se identifica con el número /, que corresponde al año histórico 
dibujado. 


Cuando las n parejas de datos están dibujadas, se busca el año 1, 
y se define un área rectangular o cuadrada de valores menores de X y de 
Q, cuyo conteo de casillas numeradas dentro es NM, o combinaciones de 
X y Y menores. Calculados los n valores de NM,, se aplica la fórmula de 
posición gráfica de Gringorten para estimar la probabilidad empírica 


conjunta o bivariada: 


Fay =PXA<x0< y = HO (20) 


n+0.12 


Selección de la función Cópula 


Un enfoque simple de selección de la función Cópula bivariada se basa en 
los estadísticos del error de ajuste, al comparar las probabilidades 
empíricas observadas (w?) con las teóricas calculadas (wf) con la FC que 
se prueba. Los indicadores aplicados son el error medio estándar (EMB), 
el error medio absoluto (EMA) y el error absoluto máximo (EAM); sus 


expresiones son (Chowdhary 8 Singh, 2019): 
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EME = |" Y7,(w? —w£)? (21) 
EMA = E, 1(w? — wp)| (22) 
EAM = maxl(w? — wp)| (23) 
1=1:n 


Dependencia en el extremo superior 


Generalidades 


El criterio más importante que se aplica para seleccionar una FC bivariada 
es el basado en la magnitud de la dependencia en el extremo superior de 
la distribución conjunta, lo cual tiene impacto en la veracidad de las 
predicciones extremas. La dependencia en la cola superior derecha (A) 
es la probabilidad condicional de que Q sea mayor que un cierto percentil 
(s) de Fo(q), dado que X es mayor que tal percentil en Fx(x) conforme s 
se aproxima a la unidad. La dependencia en la cola inferior izquierda (A, ) 
compara que Q sea menor que X cuando s se aproxima a cero (Chowdhary 
8: Singh, 2019; Salvadori et al., 2007). 


En relación con las FC expuestas, las cópulas de Frank no tienen 
dependencias en sus zonas extremas. Por el contrario, la cópula Gumbel- 


Hougaard tiene dependencia significativa en la cola superior igual a: 


ly =2-249 (24) 
100 
. ] p Tecnología y ciencias del agua, ISSN 2007-2422, 
are alpaca CO 15(4), 80-136. DOI: 10.24850/j-tyca-2024-04-03 


(https://creativecommons.org/licenses/by-nc-sa/4.0/) 


a 1) Check for updates 
OPEN ACCESS 


Tecnología y 


CienciaszAgua 


Dupuis (2007) probó seis familias de cópulas y encontró que su 
capacidad para estimar eventos extremos varía de mala a buena, con el 
siguiente orden: Clayton, Frank, Normal, t-Student, Gumbel-Hougaard y 
de Clayton Asociada (Survival Clayton). A conclusiones similares llegaron 
Poulin, Huard, Favre y Pugin (2007), al comparar las mismas seis familias 
de Cópulas y la denominada A12, que tiene dependencia significativa en 


su cola derecha. 
Estimación de la dependencia observada 


Para abordar la estimación de la dependencia en la cola superior (Au) que 
muestran los datos disponibles, primero se debe definir la llamada Cópula 
empírica. Como la FC caracteriza la dependencia entre las variables 
aleatorias X y Q, entonces el par de rangos R; y S; procedentes de las tales 
variables son el estadístico que retiene la mayor cantidad de información 
y su escalamiento con el factor 1 / (n + 1) genera una serie de puntos en 
el cuadrado unitario [O, 1]?, formando el dominio de la Cópula empírica 
(Chowdhary 8: Singh, 2019), definida así: 


Si 
"n+1 


< v) (25) 


1 Ri 
Ca(1,1)= m A Un < u 


En la ecuación anterior, 1(-) indica una función de las variables 


aleatorias U y V, que son una transformación en aumento continuo de X 
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y Y, en relación con las integrales de probabilidad empírica FX) y Fn(YN), 


cuyas ecuaciones son: 


Rango (X¡) 
0, = == = Ena) Y, = 


n+1 


Rango (Qi) 
n+1 


= Fn(q;) (26) 


Poulin et al. (2007) utilizan el estimador propuesto por Frahm, 
Junker y Schmidt (2005), el cual se basa en una muestra aleatoria 


obtenida de la Cópula empírica. Su expresión es: 


1 lim S 
AG =2- 2exp e a In | ing in3,/ Gm (27) 


Este estimador acepta que la FC se puede aproximar por una de la 
clase valores extremos; tiene la ventaja de no requerir un valor umbral 


para su estimación. 


Ratificación de la función Cópula seleccionada 


Esta es la etapa más importante del proceso de aplicación de las FC, pues 
en ella se verifica que tal modelo reproduzca fielmente las probabilidades 
conjuntas observadas (Ecuación (20)). Yue (2000a) expone una forma 
simple y práctica de representar las probabilidades conjuntas empíricas y 
teóricas, que consiste en llevar al eje de las abscisas la primera y al eje 


de las ordenadas la segunda; en tal gráfica, cada pareja de datos define 
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un punto que coincide o se aleja de la recta a 45 ”. La inspección de la 
gráfica descrita y el valor del coeficiente de correlación —en estos casos, 


superior a 0.98— ratifican la validez del modelo probabilístico conjunto. 


Yue (2000b), y Yue y Rasmussen (2002) aplican el test de 
Kolmogorov-Smirnov con un nivel de significancia (a) del 5%, para 
aceptar o rechazar la diferencia máxima absoluta (dma) entre las 
probabilidades conjuntas. Para evaluar la estadística (Dn) del test, se 
utilizó la expresión que exponen Meylan et al. (2012), para a = 5%, que 


es: 


Da — 1.358 (28) 


n es el número de datos. Si la dma es menor que D,, se ratifica la 
FC adoptada. 


Selección de las distribuciones marginales 


El planteamiento para la selección de las distribuciones marginales fue 
muy simple y consistió en aplicar las tres FDP que se han establecido de 
referencia o de aplicación bajo precepto, que son la Log-Pearson tipo III 
(LP3), la general de valores extremos (GVE) y la logística generalizada 
(LOG). Además, se aplicaron tres modelos de uso generalizado: la Pareto 
generalizada (PAG), la Kappa y la Wakeby. Las primeras cuatro FDP 
citadas tienen tres parámetros de ajuste y las dos últimas, 4 y 5. Con 


excepción de la LP3, que se aplicó con el método de momentos en los 
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dominios logarítmico (WRC, 1977) y real (Bobée, 1975), el resto se ajustó 


con el método de momentos L (Hosking € Wallis, 1997). 


La selección de la FDP más conveniente se basó en el valor que cada 
una genera con una probabilidad de no excedencia del 1 %; es decir, un 
valor muy bajo que no supere a los valores mínimos observados, para 
evitar probabilidades marginales (v) negativas. Este criterio de selección 
es el requerido en registros de gasto máximo Q que presentan valores 


mínimos muy reducidos, en comparación con sus extremos máximos. 


Además, se tomaron en cuenta los errores estándar de ajuste (EEA) 
y absoluto medio (EAM), así como la magnitud de las predicciones en los 


periodos de retorno mayores a 500 años. 


Errores de ajuste 


El primer criterio aplicado para la selección de la mejor FDP a unos datos 
o serie disponible fueron los llamados errores de ajuste (Kite, 1977; 
Willmott € Matsuura, 2005; Chai € Draxler, 2014). Este criterio y el 
descrito para evitar probabilidades negativas permitirán adoptar una 
distribución adecuada entre los modelos: LP3, GVE, LOG, PAG, Kappa y 
Wakeby. 


Cambiando en las ecuaciones (20) y (21) las probabilidades 
observadas por los datos ordenados de la serie analizada (x; o y;), y las 
probabilidades calculadas por los valores estimados con la FDP que se 
prueba o contrasta, se obtienen el error estándar de ajuste (EEA) y el 


error absoluto medio (E£AM). Los valores que se estiman (%; o ),) se buscan 
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para la misma probabilidad de no excedencia asignada a los datos con la 


fórmula empírica de Gringorten (Ecuación (19)). 


Periodos de retorno bivariados 


El primer periodo de retorno bivariado del evento (X, Y) se define bajo la 
condición OR, lo cual indica que los límites x o y, o ambos pueden ser 
excedidos, y entonces la ecuación clásica del periodo de retorno o inverso 
de la probabilidad de excedencia será (Shiau, Wang, 8 Tsai, 2006; Genest 
8: Chebana, 2017): 


1 E y el L (29) 


y P(X>x or Y>y) 1-Fx y (x,y) — 1-C[Fx(%),Fy0)] 


en la cual C[Fx(x), Fy(y)] es la FC seleccionada. 


El segundo periodo de retorno bivariado del evento (X, Y) está 
asociado con el caso en que ambos límites son excedidos (X > x, Y > y) 
o condición AND; su ecuación es (Shiau et a/., 2006; Genest 8, Chebana, 
2017): 


á 2 o 1 1 (30) 


e P(X>x and Y>y) — Fxy(x,y) > 1-F x(x)-Fy(y)+C[Fx 0) Fy()] 


Aldama (2000) obtiene la expresión Fxy(x,y) de la probabilidad 


bivariada de excedencia mediante un razonamiento de probabilidades 
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lógico y simple aplicado en el plano cartesiano. En cambio, Yue y 
Rasmussen (2002) recurren al plano cartesiano para definir el evento 
bivariado (X, Y) conceptualmente, que puede ocurrir en alguno de los 
cuatro cuadrantes. 
La relación entre los periodos de retorno bivariados y los 


univariados es la siguiente (Yue € Rasmussen, 2002; Shiau et a/., 2006; 
Vogel 8: Castellarin, 2017): 


Txy < min[Tx, Ty] € max([Tx, Ty] < T'xy (31) 
siendo: 
== == (32) 


EGO Fx) 


E: (33) 


Y HO) 1Fy0) 


Los periodos de retorno bivariados condicionales se basan en la 
distribución condicional de X, dado que Y<y, la cual se expresa así (Chen 
8 Guo, 2019): 


C[EXCO,FyG)] 
CIEXCO Pr Ol 4 
Fyr(Y) (34) 


P(X < x]Y < y) = C(Ex (O |Fy (y) < y) = 
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Una ecuación similar se obtiene para Y, dado que X < x. Por similitud 
con la ecuación anterior y la Ecuación (30), se puede obtener la 
distribución condicional para variables X y Y, excediendo a unos límites 
(Chen 8 Guo, 2019), la cual es: 


_ PX Y>Y) _ 1-FxG0)-FyW+C[FZCO Fr) 
A A (35) 


Datos por procesar 


En este estudio se procesó el registro de la estación hidrométrica 
Guamúchil de la Región Hidrológica No. 10 (Sinaloa), México. La estación 
de aforos Guamúchil tiene un área de cuenca de 1 645 km? y un registro 
de 32 años que inició en 1940 y terminó en 1971, cuando se construyó la 
presa Eustaquio Buelna (Aldama et al., 2006). En tal registro se 
eliminaron tres años: (1) 1949, cuyo gasto de 375 m/s ocurrió el 22 de 
enero; (2) 1960, con un gasto de 1 373 m/s, que se presentó el 13 de 
enero, y (3) 1968, con un gasto de 200 m/s, que aconteció el 10 de 


febrero. El registro de la estación húmeda adoptada se muestra en la 


Tabla 1, en sus columnas 1 a 6. 
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Tabla 1. Gastos de las crecientes anuales, fechas de ocurrencia, 
probabilidades de no excedencia teóricas y empíricas, y conteo para 
probabilidad empírica conjunta en la estación hidrométrica Guamúchil de 


la Región Hidrológica No. 10 (Sinaloa), México. 


1 2 3 4 5 6 7 8 9 10 
y a; (radianes) Fr(x Fe(x 
No. a Mes Día | DJ -bS Sra E de NM; 
1 255 Ago 4 216 | 3.718269 — 3.0641 — 0.041 | 0.019 3 
2 65 Sep | 22 | 265 | 4.561765 | 3.2879 | 0.086 | 0.054 il 
1.3 | 445 | Oct | 2 |275| 4.733907 | 3.5117 | 0.165 | 0.088 | 12 | 
4 | 1550 | Sep | 26 | 269 | 4.630622 | 3.5633 | 0.189 | 0.122 | 24 | 
l./5 | 392 | Ago | 30 | 242 | 4.165838 | 3.5806 | 0.198 | 0.157 | 8 | 
l./6 | 916 | Oct | 8 | 281 | 4837192 | 3.5806 | 0.198 | 0.191 | 22 | 
7 241 Ago 10 | 222 | 3.821554 | 3.6666 | 0.244 | 0.225 3 
8 530 Ago | 12 | 224 | 3.855983 | 3.6838 | 0.254 | 0.260 9 
9 648 Jul 23 | 204 | 3.511698 | 3.7183 | 0.275 | 0.294 3 


10 272 Ago 16 | 228 | 3.924839 — 3.7355 | 0.285 | 0.328 5 


11 422 Sep 7 250 | 4.303552 | 3.8216 | 0.342 | 0.363 9 


12 377 Ago 5 217 | 3.735483 | 3.8560 0.366 | 0.397 4 


13 1173 Sep 17 | 260 | 4.475694 3.9076 | 0.402 | 0.431 21 


14 219 Jul 10 | 191 | 3.287913 3.9248 | 0.415 | 0.466 2 


15 3507 Sep 23 | 266 | 4.578979 | 3.9593 | 0.440 | 0.500 25 


16 165 Jun 27 | 178 | 3.064129 | 4.0281 | 0.491 | 0.534 1 


17 526 Ago 18 | 230 | 3.959268 — 4.0970 | 0.543 | 0.569 10 
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1 2 3 4 5 6 7 8 9 10 
' a; (radianes) F F 
No. Q Mes | Día | DJ eo) ¿DO NM; 
(m?/s) obs ord ord ord 


18 1014 Sep 20 | 263 | 4.527337 | 4.1658 | 0.593 | 0.603 20 


19 1610 Ago 2 214 | 3.683840 | 4.3036 0.689 | 0.637 8 


20 525 Ago 1 213 | 3.666626 — 4.3380 | 0.711 | 0.672 5 
21 985 Oct 4 277 | 4.768336 | 4.4413 | 0.772 | 0.706 22 
22 460 Jul 26 | 207 | 3.563341 | 4.4757 | 0.791 | 0.740 3 
23 390 Ago 26 | 238 | 4.096982 | 4.5273 | 0.817 | 0.775 7 
24 449 Jul 27 | 208 | 3.580555 | 4.5618 | 0.833 | 0.809 3 
25 794 Jul 27 |208 | 3.580555 | 4.5790 | 0.841 | 0.843 6 


26 720 Ago 22 | 234 | 4.028124 | 4.6306 | 0.862 | 0.878 13 


27 312 Sep 9 252 | 4.337981 — 4.7339 0.898 | 0.912 6 


28 520 Sep 15 | 258 | 4441266 — 4.7683 | 0.909 | 0.946 13 


29 1045 Ago 15 | 227 | 3.907625 | 4.8372 | 0.927 | 0.981 12 


DJ = día juliano. 

Obs = valores observados. 

Ord = valores ordenados. 

FITO) = probabilidad de no excedencia teórica (Ecuación (7)). 
FeloO) = probabilidad de no excedencia empírica (Ecuación (19)). 


NMi = número de combinaciones de X; y Q; menores (Ecuación (20)). 
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Test de Wald-Wolfowitz 


Esta prueba no paramétrica ha sido expuesta y aplicada por Bobée y 
Ashkar (1991), Rao y Hamed (2000), y Meylan et al. (2012) para verificar 
independencia y estacionariedad en registros de gastos máximos anuales 
(Q;). Por lo anterior, se propuso aplicar la prueba a los registros de «, en 
radianes y de gastos máximos anuales, que deben ser muestras 


aleatorias. 


Resultados y su discusión 
Búsqueda de las distribuciones marginales 
Verificación de la aleatoriedad 


Primero se verificó la aleatoriedad de los registros por procesar con base 
en el Test de Wald-Wolfowitz, cuyo estadístico (U) condujo a valores de 
-0.720 y -1.522, para las fechas de ocurrencia (a) en radianes y para 
los gastos máximos de la Tabla 1. Como U es menor que 1.96, ambas 


series o muestras son aleatorias. 


Distribución de las fechas de ocurrencia anuales 


Para la aplicación del algoritmo de Rosenbrock se adoptaron como valores 
iniciales de y y K 4.25 y 0.50 a los datos (columnas 3 y 4) de la Tabla 1 


de la estación Guamúchil, los cuales definen una FO inicial de 1.040. 
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Después de 15 etapas y 83 evaluaciones de la FO se obtuvo: FO = 0.0456, 
p = 4.04104, k = 3.79233, FN = 59.3770, y los resultados concentrados 
en la columna 8 de la Tabla 1 y Figura 1. Este ajuste de la dvM recorre el 
intervalo de ocurrencias de 3.0641 a 4.8372 radianes, que corresponden 
a las fechas siguientes: del 27 de junio al 8 de octubre (281 - 178 = 103 
días). 


1) 


imensiona 


Probabilidad de no excedencia 
(ad 


3.0 3.5 4.0 4.5 5.0 
Fechas de ocurrencia (radianes) 


Figura 1. Ajuste de la distribución de von Mises a las fechas de 
ocurrencia de las crecientes anuales registradas en la estación 
hidrométrica Guamúchil de la Región Hidrológica No. 10 (Sinaloa), 


México. 
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Para estimar las fechas correspondientes a los periodos de retorno 
(Tr, años) que tendrán las predicciones de las crecientes, se procede por 
tanteos con base en la Ecuación (7), y los valores de y = 4.04104 y k = 
3.79233 obtenidos para el registro de la Tabla 1. Se adoptan el mes y día 
que definen los valores más aproximados de probabilidad de no 
excedencia [F(x)] relativa el Tr estimado. En la Tabla 2 se exponen las 


estimaciones obtenidas para los Tr indicados. 


Tabla 2. Fechas de ocurrencia estimadas con distribución de von Mises 
para los periodos de retorno indicados en las crecientes anuales 


registradas en la estación hidrométrica Guamúchil, México. 


Tr (años) Fecha Día en 109) 1-F(0) Tr (años) 
asignado | obtenida | radianes | estimada | estimada | estimado 
50 Oct 29 5.198691 | 0.97970 | 0.02030 49.3 
100 Nov 8 5.370833 | 0.98969 | 0.01031 97.0 
500 Nov 28 | 5.715117 | 0.99806 | 0.00194 515.5 

1000 Dic 4 5.818403 | 0.99904 | 0.00096 1041.7 


Distribución de los gastos máximos anuales 


En la Tabla 3 se exponen los errores de ajuste y predicciones (m/s) 
obtenidas con las tres distribuciones de referencia y las tres de uso 
generalizado, aplicadas al registro de gastos máximos de la Tabla 1. El 


valor mínimo del gasto máximo de 65 mY/s resultó inferior a las 
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magnitudes con probabilidad de excedencia del 1 % que se estiman con 
las FDP aplicadas, excepto con la distribución Kappa, y que por ello fue la 


adoptada. 


Tabla 3. Errores de ajuste y predicciones (m3/s) de las seis 
distribuciones aplicadas en el registro de gastos máximos anuales de las 
crecientes de la estación hidrométrica Guamúchil de la Región 


Hidrológica No. 10 (Sinaloa), México. 


EEA EAM Periodos de retorno, en años 
FDP 


(m3/s) | (m?/s) 50 100 500 1000 | 5000 | 10 000 


LP3 181.5 90.0 2649 | 3 246 4 855 5 650 7747 8 765 


GVE 152.6 71.1 2749 | 3647 6 852 8 929 16 361 | 21 178 


LOG 140.4 72.2 2702 | 3649 7 283 9 798 19 499 | 26 219 


PAG 163.3 82.6 2738 | 3439 5 493 6 599 9 837 11 581 


KAP 225.6 116.8 2430 | 3031 4 946 6 068 9 664 11 775 


WAK | 152.7 76.0 2789 | 3697 6 839 8 815 15 651 | 19 951 


Los parámetros de ubicación (uz), escala (a2) y forma (k2 y h2) de 
la distribución Kappa adoptada son los siguientes: 578.6213, 265.6867, 


-0.275 y -1.0, cuya expresión es: 


-u»)11/K2 ua 
FG) = (1h [1-20201%] (36) 
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La distribución Kappa adopta un valor de -—1 en su segundo 
parámetro de forma (Ah) debido a que los cocientes L (13 = 0.42744 y t, = 
0.32260) definen en el diagrama de cocientes L, un punto encima de la 


distribución Logística Generalizada (Campos-Aranda, 2023a). 


Selección y ratificación de la FC 


El procesamiento bivariado de los datos de la Tabla 1 condujo a los 
siguientes dos indicadores de asociación: rxy = 0.3563 y 1, = 0.2315. La 
Ecuación (18), con n = 29 y el tau citado origina un valor de 0.9424, por 


lo cual el cociente de Kendall no es significativo. 


Aunque el valor de tau no es estadísticamente diferente de cero, el 
ser positivo indica una correspondencia directa o concordancia, aunque 
baja, entre las fechas de ocurrencia de las crecientes y su valor de gasto 
máximo para sus magnitudes anuales. Tal relación o dependencia será 


modelada por la FC. 


En la Tabla 4 se muestran los indicadores estadísticos de ajuste que 
se obtuvieron al aplicar las FC de Frank y Gumbel-Hougaard (G-H). En las 


ecuaciones (21) a (23), las probabilidades bivariadas empíricas se 


estimaron con la Ecuación (20), y las teóricas con las ecuaciones (12) y 
CL5) 
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Tabla 4. Indicadores estadísticos del ajuste de las funciones Cópula 


indicadas en las crecientes anuales de la estación hidrométrica 


Guamúchil, México. 


Ñ No. | No. 
Cópula 0 EME EAM MDP MDN Ay 
DP DN 
Frank | 2.1790 | 0.0309 | 0.0237 | 20 9 [0.0682 | -0.0368 | 0.0000 
G-H 1.3013 | 0.0326 | 0.0246 | 18 | 11 |0.0785 | -0.0369 | 0.2965 


DP, DN = diferencias positivas y negativas. 


MDP, MDN = máxima diferencia positiva y negativa. 


Como la aplicación de la Ecuación (27) condujo a un valor de Af“ 
de 0.3416, no existe dificultad para seleccionar a la FC Gumbel-Hougaard 
en la Tabla 4. 


Por otra parte, debido a que el valor de A£F“ resultó ligeramente 
mayor que el A, de la FC, se debería buscar una FC con mayor 
dependencia en su extremo derecho, pero en este caso no es necesario 
porque no se realizarán predicciones a altos periodos de retorno, sino que 
más bien se formularán estimaciones de probabilidades de excedencia, 
según fechas de ocurrencia, a partir de los periodos de retorno 
condicionales. Chen y Guo (2019) aplican exclusivamente la FC de 


Gumbel-Hougaard en este tipo de análisis de frecuencias. 


En la Tabla 5 se muestran las probabilidades de no excedencia 
bivariadas, empíricas observadas (w?) calculadas con la Ecuación (20) y 
teóricas estimadas (w?) con la FC de Gumbel-Hougaard. También se 


indican sombreadas las diferencias máximas positiva y negativa. 
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Tabla 5. Probabilidades de no excedencia conjuntas y sus diferencias, 
calculadas con la FC de Gumbel-Hougaard, para las crecientes de 


anuales de la estación Guamúchil, México. 


No. wi w; Diferencias 
1 | 0.0879 | 0.0785 0.0094 
2 [0.0192 | 0.0561 -0.0369 
3 |0.3970 | 0.3529 0.0441 
4 |0.8091 | 0.8232 -0.0141 
5 |0.2596 | 0.2318 0.0279 
6 |0.7404 | 0.7201 0.0203 
7 [0.0879 | 0.0881 -0.0002 
8 |0.2940 | 0.2155 0.0785 
9 | 0.0879 | 0.1215 -0.0335 
10 | 0.1566 | 0.1165 0.0400 
11 | 0.2940 | 0.2812 0.0128 
12 | 0.1223 | 0.1229 -0.0007 
13 | 0.7060 | 0.7126 -0.0066 
14 | 0.0536 | 0.0250 0.0285 
15 | 0.8434 | 0.8391 0.0043 
16 | 0.0192 | 0.0103 0.0090 
17 | 0.3283 | 0.2514 0.0769 
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No. wi wi Diferencias 


18 | 0.6717 | 0.6919 -0.0202 


19 [0.2596 | 0.2485 0.0111 


20 | 0.1566 | 0.1486 0.0080 


21 | 0.7404 | 0.7410 -0.0007 


22 | 0.0879 | 0.1043 -0.0163 


23 | 0.2253 | 0.2156 0.0097 


24 | 0.0879 | 0.1061 -0.0182 


25 | 0.1909 | 0.1628 0.0282 


26 | 0.4313 | 0.3619 0.0694 


27 | 0.1909 | 0.1998 -0.0089 


28 | 0.4313 | 0.3865 0.0448 


29 | 0.3970 | 0.3623 0.0346 


Por otra parte, la Ecuación (28) define a Dn = 0.2522 y como la 
diferencia máxima absoluta de la Tabla 5 es 0.0785, el test de 
Kolmogorov-Smirnov ratifica a la FC de Gumbel-Hougaard (G-H) 
adoptada. El coeficiente de correlación (rxy) entre las probabilidades 
empíricas y las teóricas, estimadas con la FC de G-H, resultó de 0.9931; 
por lo tanto, el ajuste es excelente. El contraste gráfico entre ambas 


probabilidades, para ratificar la adopción de FC de G-H, se expone en la 


Figura 2 para los datos de la Tabla 5. 
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Probabilidad de no excedencia te 
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Probabilidad de no excedencia empírica 


Figura 2. Contraste gráfico de probabilidades conjuntas de las fechas 
de ocurrencia y del gasto máximo de las crecientes de la estación 


hidrométrica Guamúchil, México, con la FC de Gumbel-Hougaard. 


Gráficas de los periodos de retorno conjuntos 


Los periodos de retorno bivariados de tipo AND se calculan con la Ecuación 


(30). Para sus estimaciones con valores del Ty, de 50, 100 y 500 años se 
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define una fecha (mes y día), y se calcula su probabilidad de no 
excedencia F(x) con la Ecuación (7), y los valores de y = 4.04104 y k = 
3.79233. Ahora por tanteos se asigna un gasto máximo (y = Qmax) y se 
estima su F(y) con la Ecuación (36). Ambos resultados se llevan a la 
Ecuación (15), con O = 1.3013, para estimar la probabilidad de no 
excedencia conjunta y así obtener con la Ecuación (30) el Ty, que debe 


coincidir con el valor buscado. 


De manera arbitraria se seleccionan fechas de ocurrencia y gastos 
máximos para ir definiendo las curvas del Tyy. En la Tabla 6 se muestran 


los valores adoptados para definir las tres gráficas de la Figura 3. 


Tabla 6. Parejas de fechas de ocurrencia y gasto máximo anual 
utilizadas para definir las gráficas del periodo de retorno conjunto tipo 
AND con la FC de Gumbel-Hougaard en las crecientes de la estación 


Guamúchil, México. 


Txy = 50 años Txy = 100 años Txy = 500 años 
m m m 

Fecha | ND* Q Fecha | ND* Q Fecha | ND* Q 
m3/s m3/s m3/s 


Oct 29 | 121 117 Nov8 | 131 255 | Nov28 | 151 0 


Oct 27 | 119 569 Nov6 | 129 | 717 | Nov27 | 150 | 607 


Oct 25 | 117 814 Nov5 | 128 | 880 | Nov26 | 149 | 1055 


Oct 22 | 114 | 1097 Nov 3 126 | 1159 Nov25| 148 | 1452 


Oct 20 | 112 | 1248 | Oct31 | 123 | 1496 | Nov 24 | 147 | 1798 


Octi5 107 | 1530 | Oct 28 | 120 | 1749 Nov23| 146 | 2095 
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Txy = 50 años Txy = 100 años Txy = 500 años 
m m m 
Fecha |ND* Q Fecha | ND* Q Fecha | ND* Q 
m3/s m3/s m3/s 


Octi0 | 102 | 1719 | Oct 25 | 117 | 1941 | Nov22 | 145 | 2347 


Oct 5 97 1854 | Oct 20 | 112 | 2171 | Nov21 | 144 | 2560 


Oct 1 93 1937 | Oct15 | 107 | 2331 | Nov20 | 143 | 2743 


Sep 25 | 87 2034 | Oct10 | 102 | 2450 | Nov18 | 141 | 3036 


Sep 20 82 2098 Oct 5 97 |2543 | Nov15 | 138 | 3357 


Sep 15 | 77 2152 |Sep30| 92 | 2617 | Nov10| 133 | 3707 


Sep15 | 72 2197 |Sep25| 87 —2679| Nov 5 128 | 3937 


Sep 5 67 2235 |Sep20| 82 | 2731 | Oct 31 | 123 | 4103 


Ago 31 | 62 2268 |Sep15| 77 | 2776 | Oct 25 | 117 | 4252 


Ago 25 | 56 2302 |Sep10| 72 | 2815 | Oct 20 | 112 | 4349 


Ago 20 | 51 2326 Sep 5 67 |2849 | Oct15 | 107 | 4429 


Ago 15 | 46 2346 |Ago31| 62 | 2879 | Oct10 | 102 | 4496 


Ago 10 | 41 2363 |Ago25| 56 |2910| Oct 5 97 | 4554 


Ago 5 36 2377 |Ago20| 51 |2932|Sep30| 92 | 4604 


Jul 31 al 2389 |Ago15| 46 | 2951 |Sep25 | 87 | 4648 


Jul 25 25 2400 |¡Ago10| 41 | 2967 | Sep20 | 82 | 4687 


Jul 13 13 2415 Ago 5 36 |2980 | Sep 15 77 14722 


Jul 1 L 2430 | Jul 31 31 |2992 | Sep 10 72 14754 


120 


Tecnología y ciencias del agua, ISSN 2007-2422, 


Open Access bajo la licencia CC BY-NC-SA 4.0 a A e a AS 
(https://creativecommons.org/licenses/by-nc-sa/4.0/) 15(4), 80-136. DOI: 10.24850/j-tyca-2024-04-03 


a 1) Check for updates 
OPEN ACCESS 


Tecnología y 
CienciaszAgua 
Txy = 50 años Txy = 100 años Txy = 500 años 
m m m 
Fecha | ND* Q Fecha | ND* Q Fecha | ND* Q 
m3/s m3/s m3/s 


Jul 25 25 [3002 | Sep 5 67 | 4783 


Jul 20 20 |3009 | Ago 31 | 62 | 4808 


Jul 15 15 |3015 | Ago20| 51 | 4855 


Jul 10 10 |3019 | Ago10 | 41 | 4886 


JUL 1 1 3031 | Ago 5 36 | 4899 


Jul 31 31 | 4909 


Jul 25 25 |4919 


Jul 20 20 | 4926 


Jul 1 1 4946 


*ND = número de día a partir del 1? de julio. 
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Figura 3. Gráficas de los tres periodos de retorno conjunto Ty, de 
diseño obtenidas con la FC de Gumbel-Hougaard en las crecientes de la 


estación hidrométrica Guamúchil, México. 


Probabilidades de ocurrencia de eventos de diseño 
En la Tabla 7, Tabla 8 y Tabla 9 se exponen las probabilidades 


condicionales de excedencia P(X > x | Qm > qo), calculadas con la 


Ecuación (35), cuando qo tiene un periodo de retorno (Tr) de 50, 100 y 
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500 años, es decir, cuando la probabilidad marginal v = Fy(y) es igual a 
0.98. 0.99 y 0.998, y el gasto Qm excede a 2 430, 3 031 y 4 946 m/s, 
según la Tabla 3. 


Tabla 7. Cálculos de la probabilidad condicional de las fechas de 


ocurrencia dado que el gasto máximo tiene un Tr = 50 años en las 


crecientes de la estación hidrométrica Guamúchil, México. 


1 2 3 4 5 6 7 8 9 10 11 12 13 14 
PE propuesta (%) | 99 95 90 80 70 60 50 40 30 20 10 5 1 
Fecha obtenida | JUN 3 | JUN 30 | JUL 13 | JUL 27 | AGO 6 | AGO 15 | AGO 23 | AGO 30 | SEP8 |SEP18| OCT2 | OCT15 | NOV 8 
ai (radianes) = Xi| 2.6510 3.1158 | 3.3396 | 3.5806 | 3.7527 | 3.9076 | 4.0453 | 4.1658 | 4.3208 | 4.4929 4.7339| 4.9577 |5.3708 
PE real 0.9902 | 0.9509 | 0.8994 | 0.8025 | 0.7038 | 0.5977 | 0.4959 | 0.4068 | 0.3000 | 0.2002 |0.1016| 0.0488 | 0.0103 
PNE de FC de GH | 0.0097 | 0.0489 | 0.1002 0.1967|0.2949| 0.4003 | 0.5014 | 0.5897 |0.6954 | 0.7939 0.8902 | 0.9404 | 0.9739 
PE condicional | 0.9985 | 0.9916 | 0.9813 | 0.9592 | 0.9333 | 0.9012 | 0.8652 | 0.8280 |0.7726|0.7016 0.5853 | 0.4591 | 0.2106 
PE = probabilidad de excedencia, adimensional. 
PNE = probabilidad de no excedencia, adimensional. 
GH = FC de Gumbel-Hougaard. 
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Tabla 8. Cálculos de la probabilidad condicional de las fechas de 


crecientes de la estación hidrométrica Guamúchil, México. 


1 2 3 4 5 6 7 8 9 10 11 12 13 14 
PE propuesta (%)| 99 95 90 80 70 60 50 40 30 20 10 5 1 
Fecha obtenida | JUN 3 | JUN 30 [JUL 13|JUL 27 | AGO 6 | AGO 15 | AGO 23 | AGO 30 | SEP 8 [SEP 18| OCT2 | OCT 15 | NOV 8 
a (radianes) = X; [2.6510 | 3.1158 |3.3396|3.5806|3.7527| 3.9076 | 4.0453 | 4.1658 |4.3208 |4.4929|4.7339| 4.9577 [5.3708 
PE real 0.9902| 0.9509 [0.8994 0.8025|0.7038| 0.5977 | 0.4959 | 0.4068 [0.3000 0.2002|0.1016| 0.0488 [0.0103 
PNE de FC de GH [0.0098| 0.0490 [0.1005|0.1972 0.2957| 0.4015 | 0.5030 | 0.5918 [0.6982 |0.7974|0.8951| 0.9467 (0.9828 
PE condicional |0.9988| 0.9932 |0.9849|0.9671|0.9461| 0.9202 | 0.8911 | 0.8609 |0.8160|0.7582|0.6622| 0.5543 [0.3073 
PE = probabilidad de excedencia, adimensional. 
PNE = probabilidad de no excedencia, adimensional. 
GH = FC de Gumbel-Hougaard. 
Tabla 9. Cálculos de la probabilidad condicional de las fechas de 
ocurrencia dado que el gasto máximo tiene un Tr = 500 años en las 
crecientes de la estación hidrométrica Guamúchil, México. 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
PE propuesta (%)| 99 95 90 80 70 60 50 40 30 20 10 5 1 
Fecha obtenida | JUN 3 | JUN 30 [JUL 13|JUL 27| AGO 6 | AGO 15 | AGO 23 | AGO 30 | SEP 8 [SEP 18| OCT2 | OCT 15 | NOV 8 
a; (radianes) = x [2.6510] 3.1158 [|3.3396|3.5806|3.7527| 3.9076 | 4.0453 | 4.1658 [4.3208 4.4929|4.7339| 4.9577 [5.3708 
PE real 0.9902| 0.9509 [0.8994 0.8025|0.7038| 0.5977 | 0.4959 | 0.4068 [0.3000 0.2002|0.1016| 0.0488 [0.0103 
PNE de FC de GH [0.0098| 0.0491 [0.1006|0.1975 0.2961] 0.4022 | 0.5030 | 0.5918 [0.6982 |0.7974|0.8951| 0.9467 (0.9828 
PE condicional |0.9993| 0.9958 |0.9907|0.9798|0.9670| 0.9510 | 0.8911 | 0.8609 |0.8160|0.7582|0.6622| 0.5543 [0.3073 
PE = probabilidad de excedencia, adimensional. 
PNE = probabilidad de no excedencia, adimensional. 
GH = FC de Gumbel-Hougaard. 
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Entonces, para el caso de qo = 2 430 m3/s (Tabla 7), se tienen las 

siguientes probabilidades de eventos: (1) la probabilidad de ocurrencia 
de tales gastos después del 13 de julio es de 98.13 %; (2) la probabilidad 
de que tales gastos ocurran entre el 13 de julio y el 8 de noviembre será 
98.13 — 21.06 = 77.07 %, y (3) durante el lapso de 8 al 18 de septiembre 
será 77.26 — 70.16% = 7.10 %. 


Entonces, para el caso de go = 3 031 m/s (Tabla 8), se tienen las 
siguientes probabilidades eventos: (1) la probabilidad de ocurrencia de 
tales gastos después del 13 de julio es de 98.49 %; (2) la probabilidad 
de que tales gastos ocurran entre el 13 de julio y el 8 de noviembre será 
98.49 — 30.73 = 67.76 %, y (3) durante el lapso de 8 al 18 de septiembre 
será de 81.60 — 75.82 = 5.78 %. 


Por último, para el caso de go = 4 946 m/s (Tabla 9), se tienen las 
siguientes probabilidades eventos: (1) la probabilidad de ocurrencia de 
tales gastos después del 13 de julio es de 99.07 %; (2) la probabilidad 
de que tales gastos ocurran entre el 13 de julio y el 8 de noviembre será 
99.07 — 54.23 = 44,84 %, y (3) durante el lapso de 8 al 18 de septiembre 
será de 88.70 — 85.14 = 3.56 %. 


La comparación entre los resultados de los tres límites establecidos 
para el gasto máximo (qo) indica que la probabilidad de ocurrencia 
después del 13 de julio aumenta ligeramente conforme el go crece, lo cual 
es lógico, dada la correlación positiva de rxy = 0.3563 mostrada entre las 


fechas de ocurrencia y los gastos máximos. A lo anterior también influye 


el denominador de la Ecuación (35), el cual, conforme aumenta qo, se 
reduce de 0.02 a 0.002. 
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Por el contrario, las dos probabilidades de ocurrencia calculadas 
para los dos lapsos dentro de la estación húmeda decrecen conforme go 
aumenta, lo cual se debe a la menor probabilidad de excedencia de cada 


gasto máximo, al tener el 2, 1 y 0.2 %. 


Contraste con resultados de un trabajo anterior 


Chen y Guo (2019) exponen en sus páginas 42 a 44 y Tabla 3.2, como 
caso de estudio de un análisis de frecuencias de crecientes bivariado de 
fechas de ocurrencia y gasto máximo, su aplicación en el embalse 
Geheyan de múltiples propósitos, con una cuenca de 17 000 km?, que 
recibe una precipitación media anual de 1 500 milímetros, y cuya 
temporada de crecientes abarca cinco meses del 1% de mayo al 30 de 
septiembre (153 días). Guardando las debidas proporciones, los 
resultados de su Tabla 3.2 son coincidentes con los de la Tabla 8 debido 


a que ambas son para un gasto máximo de periodo de retorno 100 años. 


Aplicación en cuencas con dos estaciones húmedas 


En general, en las cuencas grandes solo las tormentas que originan los 
frentes fríos y los huracanes las abarcan en su totalidad con lluvias de 
baja intensidad y larga duración, que generan crecientes de gran 
magnitud por su gasto máximo, volumen y duración. En cambio, en tales 


cuencas, las tormentas convectivas son locales, de gran intensidad y dan 


origen a crecientes ordinarias. 
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En México, las grandes cuencas de la zona montañosa de la Región 

Hidrológica No. 10 (Sinaloa) presentan dos fechas de ocurrencia de sus 
crecientes: en otoño e invierno (de noviembre a marzo), y en el verano 
(de junio a septiembre). En estos regímenes de crecientes existen dos 
modas y su caracterización probabilística de sus fechas de ocurrencia se 
realiza con una mezcla de distribuciones de von Mises (Carta et a/., 2008; 
Campos-Aranda, 2023b). 


Chen et al. (2010), y Chen y Guo (2019) han expuesto análisis 
estacionales crecientes para definir épocas de ocurrencia en cuencas con 


dos o más estaciones húmedas. 


Aplicación en cuencas grandes con una estación 
húmeda 


En cuencas grandes con regímenes de crecientes de una sola temporada 
húmeda, el estudio bivariado de fechas de ocurrencia y gasto máximo en 
sus diversos colectores o ríos principales puede ayudar a entender la 
evolución o desarrollo que tienen sus crecientes, y entonces hacer 


pronósticos más confiables de fechas de llegada hacia aguas abajo. 
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Conclusiones 


El análisis de frecuencias bivariado de fechas de ocurrencia (X) y gasto 
máximo (Qm) de las crecientes anuales resulta factible debido a las 
funciones Cópula, las cuales permiten construir su distribución de 
probabilidades conjunta con base en unas marginales univariadas; la que 
caracteriza a las fechas de ocurrencia es la distribución de von Mises y la 


de los Qm es una FDP idónea. 


En este estudio se utilizó una función Cópula (FC) de un solo 
parámetro de ajuste (6), que se estima con base en el cociente tau de 
Kendall, el cual se calcula con el registro conjunto de X y Qm. Tal enfoque 
primero estima a A“ o dependencia observada en la cola derecha del 
registro conjunto disponible. Después se busca una FC que reproduzca tal 
valor de 25“; en este estudio, la de Gumbel-Hougaard. También se aplica 
una FC que no tiene dependencia significativa en su cola derecha, como 
es la de Frank, para poder comparar y juzgar la calidad del ajuste de la 


FC adoptada previamente. 


La aplicación numérica descrita en los 32 datos anuales de fechas 
de ocurrencia y gasto máximo (m%3/s) de las crecientes anuales 
registradas en la estación hidrométrica Guamúchil de la Región 
Hidrológica No. 10 (Sinaloa), México, mostró en la Figura 2 una 
reproducción fidedigna de las probabilidades bivariadas empíricas y 
teóricas a través de la FC de Gumbel-Hougaard, con un coeficiente de 


correlación lineal de 0.9931. 
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Por otra parte, en la Figura 3, relativa a los periodos de retorno 
conjuntos de diseño de tipo AND, se pueden definir infinitas parejas de X 


y Qm críticas por estar en la región curva de cada gráfica. 


Finalmente, en la Tabla 7, Tabla 8 y Tabla 9 se expone el cálculo de 
las probabilidades condicionales, las cuales permiten estimar, para un 
lapso adoptado arbitrariamente, la probabilidad de excedencia de eventos 


de diseño con periodos de retorno de 50, 100 y 500 años. 
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